
近期,DeepSeek开源模型以低成本、高性能、性价比等突出优势,引发全球广泛关注,并带来爆发式行业应用增长。金融行业作为人工智能大模型落地的最佳场景之一,积极拥抱新技术落地,多家金融机构和金融科技公司已接入或部署该模型。在全球人工智能技术竞争日趋白热化背景下,DeepSeek有力驱动了人工智能应用与国产算力崛起。也要看到,生成式人工智能大模型在金融行业广泛应用仍存在不少问题和挑战。展望未来,DeepSeek将为金融行业带来哪些行业变革和发展机遇?如何以强大技术实力和创新精神助力金融行业迈向更加智能高效发展道路?值得政产学研各界共同探讨。
在此背景下,中国数字金融合作论坛与深圳香蜜湖国际金融科技研究院于近日联合举办“DeepSeek在金融行业的实践与展望”闭门研讨会。与会专家深入探讨人工智能发展最新趋势,特别是DeepSeek为各行各业带来的变革与机遇,积极分享DeepSeek在金融行业应用实践与案例、应用拓展模式与路径,客观分析生成式人工智能大模型在金融行业广泛应用面临的问题与挑战,并就如何发挥DeepSeek在成本与开源等方面突破与优势,以强大技术实力和创新精神助力金融行业智能高效发展提出相关对策建议。

会议由清华大学五道口金融学院教授、中国人民银行参事、我院学术委员会委员张健华主持,分为主题演讲、主题交流、圆桌讨论等环节。

张健华
主题演讲
中国科学技术信息研究所党委书记赵志耘,欧洲科学院外籍院士、清华大学人工智能研究院常务副院长孙茂松受邀发表主题演讲。

赵志耘

孙茂松
机构分享
中国工商银行金融科技部总经理杨龙如,恒生电子首席科学家、恒生研究院院长白硕,北京银行首席信息官龚伟华,苏商银行副行长、首席信息官黄进,广发证券信息技术部总监、AI负责人王蓁,兴业证券金融科技部总经理蒋剑飞等行业专家在机构分享环节发言。

杨龙如

白硕

龚伟华

黄进

王蓁

蒋剑飞
专家点评
全国政协委员、科学技术部原副部长李萌,中国证监会科技监管司副司长刘铁斌,国家发展改革委财金司司长赵怀勇,中国银行业协会原首席信息官、我院学术委员会委员高峰等领导在专家点评环节发言。

李萌

刘铁斌

赵怀勇

高峰
圆桌讨论
原中国保监会副主席、党委副书记周延礼,中国银行原行长李礼辉,江苏银行首席信息官梁斌,百融云创科技股份有限公司董事长张韶峰等领导和专家在圆桌交流环节发言。
DeepSeek“三重进化论”
解锁金融AI新势能
会议认为,随着Transformer架构提出,人工智能正朝着更高效、更智能、更通用的方向发展,预训练大模型成为生成式人工智能主流创新方向。全球人工智能领域技术创新加速,在生成速度、多模态能力、推理精度等方面实现了群体性突破。今年年初,全球科技巨头掀起大模型竞赛热潮。从国际看,OpenAI发布新版本GPT-4o和旗下首个免费推理模型o3-mini;Anthropic推出全球首个混合推理模型Claude 3.7 Sonnet;马斯克旗下xAI公司发布最新一代大模型Grok 3。从国内看,以DeepSeek为代表的中国大模型凭借其技术层面的深厚实力和创新能力,成功跻身全球大模型技术第一梯队。
会议指出,DeepSeek通过创新架构设计、开源模式和训练策略,打破了“大数据+大算力+强算法”的主流技术路线,为人工智能发展开辟了“小数据+精算法”的效率创新路径,推动行业对尺度定律从单一维度理解转向多阶段复合性理解。具体表现在:一是成本优化,开拓AI普惠之路。与传统依赖海量数据与算力堆砌的“暴力美学”路径不同,DeepSeek直接对英伟达的底层硬件指令PTX语言进行优化,在同等性能下节省90%以上资源,推动大模型技术平权,从“寡头玩家”向“普惠工具”转变。二是开源拓展,激发应用创新活力。DeepSeek始终秉持技术开源理念,选择“最大程度开放权重”的开源许可证,改变了过去LLaMa引领开源大模型的发展格局,引领全球开源大模型的更高水平。三是工艺改良,稳步推动技术进步。DeepSeek的创新主要体现在工程层面的优化和改进,而非基础理论或技术架构的颠覆性突破,基于Transformer架构,通过新的强化推理学习技术涌现长思维链能力,从“结果正确”迈向“过程可解释”。不同于美国企业如OpenAI追求超大规模参数和专用硬件集群,以实现最大程度的智能涌现的路径,DeepSeek以综合最优为核心目标,通过算法优化绕过高算力依赖,反向催生“效率创新”路径,形成“轻量化模型+社区协作”的生态,以更加主动姿态参与全球大模型竞争,缩小中美AI发展差距、展现开源“后发”优势。
会议认为,当前DeepSeek在政务、医疗、教育等领域应用已取得积极进展,国产芯片企业、云平台、运营商、互联网平台等积极与DeepSeek进行适配,形成四种常见应用模式:一是模型即服务模式(MaaS),直接使用或通过API接口调用DeepSeek模型,具备快速接入AI能力、成本低、灵活性高等优点;二是本地部署模式,将DeepSeek模型部署在本地服务器或内网环境,适合对数据安全和隐私要求高的场景;三是优化自身垂类大模型模式,通过私有化部署DeepSeek训练优化垂类大模型,提升专业场景表现,缩短研发周期;四是端侧大模型模式,手机、汽车、个人电脑等端侧AI上下游厂商纷纷融合部署DeepSeek,实现实时、离线的AI应用。值得注意的是,DeepSeek在金融领域展现出强大的应用潜力,为赋能金融“五篇大文章”、加快建设金融强国、提升服务实体经济质效提供技术支撑。一方面,DeepSeek在金融领域的应用因其因果链可视化特性,具有更强的可解释性和可信度。另一方面,DeepSeek的多模态推理、轻量化部署等技术架构与金融行业的强数据驱动、严合规要求、高安全标准、实时敏感等特性深度耦合,有望在实时高频交易、监管技术与模式等领域成为替代传统规则引擎的核心技术变量。
会议指出,金融机构与科技公司积极投身于DeepSeek等人工智能大模型的探索与实践,持续验证其在金融领域的应用价值。银行业通过智能客服、流程优化、智能风控等场景应用,大幅提升工作效率和服务质量。中国工商银行通过私有化部署DeepSeek模型,实现了智能搜索、金融百科、数据分析、文章撰写等通用能力提升。北京银行打造人工智能驱动的商业银行(AIB),在智能报告生成(如信审报告、尽调报告)、智能客服、智能审计等方面应用DeepSeek,提升业务效率和质量。苏商银行发挥DeepSeek等大模型优势,抽象出适合不同场景的大模型业务能力,便于全行各业务单元快速经济应用大模型能力,大模型场景上线时间缩减到两周以内。江苏银行较早部署DeepSeek系列开源模型,并应用于合同质检、托管、估值、对账等细分场景,实现自动化处理,提升流程效率。证券业围绕大模型核心加速构建智能化应用,传统券商结合业务优势打造高价值应用,新势力券商聚焦面客智能场景,头部券商通过自研或联合研发构建生态壁垒。广发证券在内部员工展业平台“金钥匙”上部署了基于DeepSeek的新一代智能问答系统“智能犇犇”,实现精准知识匹配、智能内容生成、动态进化机制三大突破,提升投顾团队的工作效率和服务质量。兴业证券在智能客服、投研、投行等领域进行DeepSeek试点和探索,积累实践经验。保险业积极探索DeepSeek在客户服务、运营保障、风险合规、经营分析、投资研究、信息披露和法律实务等领域的应用,增强科技赋能防范风险能力,多家保险公司已实现智能客服、精准营销、核保理赔等场景接入,收效良好。科技公司通过在量化策略生成、客户信用风险分析等领域的应用,展示了DeepSeek的强大功能和广泛适用性。恒生电子利用DeepSeek量化经验和代码能力,根据需求描述和市场环境自动生成更全面、逻辑更严密的策略代码,重塑策略孵化模式。百融云创完成了DeepSeek的深度适配与优化,提升其自主研发的Cybot Star Agent Builder应用能力,帮助企业加速进入智能时代。
DeepSeek在金融领域规模化应用
需直面四大挑战
DeepSeek在框架、策略、开源三方面的创新意义重大、影响深远,助推AI普惠逐步实现,但也要看到,它仍然在Transformer框架之下,并没有完全解决生成式人工智能在金融行业应用面临的数据、算力、算法以及场景适配等困难与挑战。
一是高质量可用数据不足,数据治理要求持续上升。随着大模型预训练不断成熟,公共领域数据高质量语料已接近消耗殆尽,未来模型预训练面临数据不足问题。前沿领域已开始使用大量合成数据,如xAI Grok3,但要警惕合成数据/再生数据泛滥导致的模型质量退化。同时,金融机构内部知识可能存在过时、不一致或冲突等隐藏问题,也会导致生成内容的质量保障及复核难度指数级增长。
二是算力不足仍是大模型技术在金融行业创新应用的重要瓶颈。DeepSeek通过效率革命拓展了大模型部署应用边界,推动人工智能发展进入更复杂的演进阶段,但并没有否定尺度定律的核心逻辑,即大模型性能与规模(参数量、数据量、算力投入量)呈正相关这一规律在预训练阶段仍被验证有效。因此,虽然DeepSeek找到了一个更高效的路径,减少了部署及应用的算力要求,但对金融机构而言并不意味着应用大模型的算力投入和人力投入刚性成本可以下降。目前我国与美国的算力水平差距仍然比较大,过去训练阶段算力需求较高,未来大量推理渲染阶段对算力资源的需求还将大幅度提升。
三是AI幻觉等固有缺陷仍未破解,难以完全满足监管合规要求。DeepSeek由于因果链可视化,具备更强的可解释性和可信度,但仍未弥补生成式大模型的固有缺陷,比如AI幻觉,大模型生成内容的准确性和稳定性仍是金融机构在实际应用中需要特别关注的问题。在Vectara HHEM人工智能幻觉测试中,DeepSeek-R1显示出14.3%的幻觉率,大幅超过V3的3.9%,也高于ChatGPT-o1。从DeepSeek思维链输出可以看出,即便面对一个简单指令,大模型也会不厌其烦地从不同角度理解和延伸,可能过犹不及。简单任务的复杂化可能会导致结论偏离,增加AI幻觉。同时,模型还可能生成不当内容或错误内容,输出虚假信息、不当营销内容或违反监管规定的建议。此外,对于大模型的可解释性和可追溯性尚缺乏明确解决方案,在投研、投顾、风控等环节的应用可能无法满足合规对于AI决策可解释性和可追溯性的要求。
四是大模型技术应用边界有待厘清,缺少技术应用质效评价标准。大模型技术不是万能的,实践来看,在专业性、时效性、数据安全性要求比较高的场景,比如基于财务报表的风险分析、即时问答、高频交易等,直接使用DeepSeek模型效果不及预期。DeepSeek等大模型对不同金融业务场景的适配度不一,需要金融机构在实践中不断探索。同时,金融行业对人工智能应用质效的评价口径尚不统一,缺乏一套对衡量数字化、智能化收益的科学评价体系,场景间、机构间横向对比,以及同一场景、同一机构纵向对比参考性不足,不利于机构自身合理度量和评价科技投入成效、管控投入成本,也降低了各行业先行者经验的推广效率。
充分释放大模型应用潜力
推动金融行业智能化升级
从工业革命到AI浪潮的实践证明,突破性创新往往呈现基础理论与应用工程的交替式上升,因此未来大模型技术的发展与应用可能长期处于尺度定律框架和效率革命的动态平衡中。为发挥DeepSeek在成本与开源等方面突破与优势,以强大技术实力和创新精神助力金融行业智能高效发展,与会专家提出以下建议。
一是夯实数据支撑体系。建议有关部门牵头,围绕金融业务场景使用,构建金融行业可信数据和知识信息管理体系。各金融机构可聚焦本地数据微调和推理应用,推动行业共享数据预训练微调。还可围绕跨业务条线,建立合理的知识复用、脱敏与隔离评估机制,确保知识密度最大化。大模型在金融领域落地的关键在于突破金融数据闭环生态与可解释性之间的平衡。构建金融知识图谱,整合企业股权结构、供应链关系等非结构化数据,完成风险传导路径建模,实现风险可视化是解决该难题的核心。
二是提升国产算力水平。要持续提升国产算力训推效率,打破算力约束困境。建立基于国产算力的二次训练和强化学习体系,支持端边云算力协同,完善知识工程体系。建议构建行业云算力平台,缓解算力紧缺和成本压力。优先推动全面国产化信创改造,探索通用计算、智能计算、超级计算和量子计算协同发挥作用。尽快建设以国产GPU为主的万卡集群,紧抓DeepSeek突破机遇,探索非N芯片生态的可行路径,构建有效、稳定的异构算力体系。
三是优化算法幻觉应对机制与监管合规体系。一方面,积极推广私域部署,在关键应用环节可利用自有数据和人工干预驱动大模型思考和输出,通过专业外挂思维链精准对接数据和系统,有效压制模型幻觉。围绕高频场景逐步落地,关键环节通过人工审核把关,确保大模型生成内容可控且适配现有内外部要求。另一方面,坚持包容审慎原则,探索建立金融领域人工智能分级分类监管制度。构建动态博弈、均衡监管框架,在保障合规风险管控的基础上,给予金融行业适度创新空间。提升“以技治技”能力,防控金融领域人工智能应用风险。
四是健全大模型应用的法律法规和行业规范。一方面,需明晰大模型在金融领域的应用边界和负面清单,确定大模型技术应用上云及本地化部署的场景范围及评价标准,持续迭代业务和技术指引。另一方面,应建立科学量化的评价标准,统一效果评估口径,避免出现效果夸大或不一致现象,为金融机构数字化、智能化转型决策提供可靠参考与依据,推动大模型技术在金融行业健康有序发展。